خوشه بندی داده های طولی بر اساس مدل های آمیخته گاوسی و ناگاوسی دم کلفت
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده علوم ریاضی
- نویسنده وریا عبدالله نژاد
- استاد راهنما عادل محمدپور محسن محمدزاده
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1390
چکیده
چکیده امروزه جمع آوری اطلاعات از طریق کامپیوتر و اینترنت باعث تولید زیاد داده شده است. کسب دانش از مجموعه داده های بزرگ ممکن است پیچیده و در مواردی غیر ممکن به نظر آید، بنابراین نیاز به داشتن روش ها و تکنیک هایی برای تلخیص و استخراج اطلاعات از این نوع داده ها ضروری است. یکی از تکنیک های مرسوم برای این کار خوشه بندی است. اساس این روش خلاصه کردن یک مجموعه از مشاهدات در تعداد محدودی گروه است، یا به طور هم ارز ایجاد یک افراز روی مجموعه ای از مشاهدات در داخل چند گروه جدا از هم به طوری که مشاهدات داخل هر گروه مشابه یکدیگر می باشند و مشاهداتی که در گروه های متفاوت قرار گرفته اند شباهت کمتری دارند. نوع خاصی از داده هایی که در چند سال اخیر بیشتر به آن توجه شده است داده های طولی می باشند که در واحدهای متوالی زمان از واحدهای مشخص به دست می آیند. هدف این پایان-نامه ارائه روشی برای خوشه بندی مدل-پایه برای داده های طولی است. برای این منظور داده های طولی با استفاده از توزیع های گاوسی و ناگاوسی با در نظر گرفتن ساختار کوواریانس مناسب برای این داده ها، خوشه-بندی می شوند.
منابع مشابه
خوشه بندی پروفایل های طولی با استفاده از مدل های اثرات آمیخته ناپارامتری و نیمه پارامتری
مطالعات طولی یکی از شاخههای علم آمار است که در ارتباط با مجموعه دادههایی است که در طول زمان اندازهگیری میشوند. یکی از حوزههای مطالعاتی دادههای طولی در پزشکی و ژنتیک است. از آنجا که خوشهبندی دادههای بیان ژن دورهای زمانی بافتهای سلولی افراد مختلف به خوشههای همگن مفید است و کسب دانش از این مجموعهی عظیم دادهها ممکن است پیچیده و در مواردی غیر ممکن بهنظر آید، از اینرو شناسایی روشهایی...
متن کاملنحوه خوشه بندی آماری داده های شکل
اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...
متن کاملتحلیل دوسطحی با اثرات تصادفی چوله نرمال و مدل بندی داده های طولی
مدل سازی داده های دوسطحی با فرض نرمال بودن مولفه تصادفی و خطا انجام می شود. عدم برقراری این فرض باعث استنباط غلط در مورد پارامترهای مدل می گردد. در این مقاله، استفاده از خانواده توزیع چوله نرمال که خانواده ای انعطاف پذیرتر از توزیع نرمال است مطرح می شود. سپس در یک مطالعه شبیه سازی نشان داده می شود عدم در نظر گرفتن چولگی مثبت (منفی) در مدل باعث بیش برآوردی (کم برآوردی) عرض از مبدا و کم برآورد...
متن کاملخوشه بندی پروفایل های طولی با استفاده از اسپلاین تاوانیده و مدل اثرات آمیخته
مطالعات طولی یکی از شاخه های علم آمار است که در ارتباط با مجموعه داده هایی است که در طول زمان اندازه گیری میشوند. یکی از حوزههای مطالعاتی دادههای طولی در پزشکی و ژنتیک است. با توجه به افزایش بیماریهایی از جمله سرطان که عامل مهمی از مرگ و میرها را تشکیل میدهد، شناسایی، درمان و پیشگیری این نوع بیماریها از طریق خوشه بندی داده های بیان ژن دورهای زمانیِ سلولهای سرطانی افراد مختلف به خوشه های هم...
15 صفحه اولطبقه بندی تصاویر فراطیفی با استفاده از مدل آمیخته ی گاوسی و الگوریتم نمونه گیر گیبز
با پیشرفتهای فناوری سنجش از دور و تولید دادههای فراطیفی با اطلاعات طیفی فراوان، استفاده از این دادهها جهت مطالعه دقیق پدیدهها به سرعت در حال گسترش است. تصاویر فراطیفی به دلیل نمایش گسترده خصوصیات طیفی عوارض و پدیدههای سطح زمین در بسیاری از علوم زمین مورد توجه قرار گرفتهاند. یکی از مهمترین کاربردهای تصاویر فراطیفی، طبقهبندی آنها و تولید نقشههای پوشش زمینی بدون نیاز به دادههای واقعیت زم...
متن کاملمدل بندی و تحلیل داده های فضایی ناگاوسی براساس آمیختن مقیاسی از یک میدان تصادفی چوله گاوسی بسته
در رگرسیون کلاسیک و فضایی معمولا فرض می شود که داده های تحت بررسی نرمال هستند. اما در عمل با موارد متعددی مواجه می شویم که در توزیع داده ها شواهدی از چولگی یا سنگینی دم ها مشاهده می شود. در اینگونه مسائل، خانواده توزیع های آمیخته مقیاسی از چوله نرمال روش مناسبی برای مدلبندی داده ها فراهم می سازد. در این رساله با هدف ارائه مدل های جدید و انعطاف پذیر که با مشکلات مدل های موجود مواجه نباشد، ابتدا...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده علوم ریاضی
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023